Alteryx CommunityのLive Trainingを受けてみた―Getting Started with Alteryx Designer編―
ごあいさつ
こんにちは。
この度ご縁があり、ゲストブロガーとしてAlteryxに関する記事を投稿させていただくことになりましたAlteryx初心者のshoと申します。
どうぞよろしくお願い申し上げます。
はじめに
まだAlteryxを使い始めて間もなく、どこから始めたらいいのかわからず悩んでいたところ、以下のページでも紹介されているAlteryx Community内のLive Trainingを発見しました。
Alteryxのスキルアップ手順について:各種学習リソースご紹介
Live Trainingという名前の通り、定期的にリアルタイムでトレーニングが受講できます。
過去のトレーニングは、動画で公開されていて尚且つ初心者向けのコンテンツもあるということで、今回はまずこの中の“Getting Started with Alteryx Designer”を受けてみることにしました。
事前準備
Live Trainingの動画を見るにあたり、Alteryx Communityにてアカウント登録を行い、サインインしておく必要があります。
Live Training:Getting Started with Alteryx Designer
Getting Started with Alteryx Designer
内容
60分ほどのコンテンツとなっているのですが、ワークフローの実践に入る前の15分間は、Alteryx Communityのコンテンツに関する紹介、及び説明があります。
情報共有に役立つだけでなく、初心者からプロフェッショナルな方々まで幅広く網羅されているのでとても便利だそうです。
開始15分以降40分間、ワークフローの処理内容を1つずつ丁寧に説明しながら実際に操作をしているところを見せてくれるので、とてもわかりやすかったです。
課題
使用するデータ
ある販売店の以下2種類のデータ
- 店舗の地理情報
- 各店舗の販売
実施する処理
- 別々にあるファイルを結合
- 分析する対象の店舗タイプを1つ選択
- 店舗ごと、および地域ごとの合計売上を計算
- 総売上高に基づいて、地域ごとに上位5つの店舗を出力
実際に作成したワークフローがこちら。
使用したツールは以下の10種類です。
- データ入力
- ユニオン
- セレクト
- 結合
- フィルタ
- フォーミュラ
- 集計
- ソート
- サンプリング
- データ出力
インプットデータ
■地理情報データ
■売上データ
まず、3ファイルに分かれている地理情報データファイルを“ユニオン”ツールを使用して統合します。
その際、以下の3つの設定方法があります。
- 名前による自動設定
- 位置による自動設定
- 手動でフィールドを設定
今回は、各ファイルの項目名称が一致しているので“名前による自動設定”を選択します。
次に、“結合”ツールを使用して、地理情報データと売上データを結合します。
結合する際には、対象となるデータ項目を指定する他、実際に結合したのち出力するデータ項目を選択します。
今回、指定する項目は店舗番号情報としてデータに含まれている“store num”と“store number”になります。
ここで、ワークフローを実行したところ、エラーが発生しました。
エラーメッセージは
“文字列フィールドは他の文字列フィールドにのみ結合できます。”
となっていました。
実際に、地理情報データの店舗番号を確認したところ、データ型が文字列となっている一方で、売上データの店舗番号は、データ型が数値となっていました。
そのため、“セレクト”ツールを使用して店舗情報のデータ型を数値から文字列に変更しました。
“セレクト”ツールでは、データ型の変更だけでなく、データ項目の並べ替えや項目の削除をすることも可能です。
結合処置が完了したら、“フィルタ”ツールを使用して店舗タイプが“Mall”のデータのみ抽出します。
ここで、ようやく計算式を使用する準備が整いました。
“フォーミュラ”ツールを使用して“Cash Sales”と“Credit Sales”を足して、総売上を算出します。
この後は、地域別の総売上と地域ごとの店舗別売上TOP5を算出するのみです。
まず、“集計”ツールを使用して、“Region”にてグループ化した、和を算出するよう設定します。
そして、“ソート”ツールを使用して、地域を昇順、総売上を降順にて表示させた後、“サンプリング”を使用して、地域ごとに最初の5行のみを出力するよう設定しました。
これにて、処理は完了です。
最終的にできたデータがこちらです。
最後に
今回のLive Trainingにて作成したワークフローでは、
- 各種データの取り込み:データ入力ツール
- 複数ファイルを統合:ユニオンツール
- データ型の変更:セレクトツール
- 異なるインプットデータから取得したデータを統合:結合ツール
- データ項目にある条件に指定:フィルターツール
- あるデータ項目を演算子を使用して集計:フォーミュラツール
- あるデータ項目にてグループ化し集計:集計ツール
- データの並べ替え:ソートツール
- データを指定した条件にて抽出:サンプリングツール
- 結果をCSVファイルに出力:データ出力ツール
という形になりました。
Getting Startedということで、初心者向けにも関わらず10種類のツールの使用方法を勉強することができたのでかなり収穫があったという実感を持つことができました。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。